查看原文
其他

老姚专栏 | 无处不在的选择偏差问题

数据Seminar 2023-01-01

本文首发于澎湃商学院(2021-04-07)

原标题为《如此“晒”营商环境改善成绩不足取》


启研学社由知名学者担任学术顾问,高校师生与企研数据科学团队联合组建,以大数据资源及相关技术助力中国学术与智库研究为宗旨的研究组织。团队当前的主要目标是挖掘经济社会大数据资源在学术和智库领域的应用价值,开展学术大数据治理研究,以及探索大数据分析技术融入中国经济社会研究的可行进路。


  营商环境是市场主体赖以生存和发展的土壤,体现了地区经济的综合竞争力。

近年来,各地区竞相以优化营商环境为经济工作重头戏。在此过程中,少数以前营商环境口碑欠佳的地区,为尽快扭转公众的刻板印象,通过媒体大张旗鼓地“晒”出了成绩。例如,据报道,某地区开展营商环境评价专项调研,参与调研的属地企业对当前营商环境现状的总体评价满意度超过99%。


满意





不满意





通过统计调查而非典型个案晒成绩,一般来说更有说服力。毕竟,典型个案存在以点概面之嫌。然而,如果统计调查设计缺乏科学性,也会产生误导性的结果。笔者认为,上述报道中满意度超过99%这一统计结果,就存在明显的”自选择偏差”,以致过度渲染了营商环境改善的成绩。


自选择偏差

那么,什么是自选择偏差呢?就上述案例而言,其指完全由参与调研的属地企业构成统计样本,会系统性地遗漏对营商环境评价较低的那些投资者或者企业,进而导致统计结果对营商环境现状总体评价的高估。

为了理解这种统计学偏差,我们不妨首先设想存在两类投资者:







第一类




在实地考察后对该地区营商环境评价较高,遂选择在该地区投资建厂







第二类




在实地考察后对该地区营商环境评价较低,遂选择不在该地区投资建厂

显然,统计样本完全由参与调研的属地企业构成,就包括了第一类投资者而排除了第二类投资者,这自然会拉高对营商环境现状的总体评价。

我们再设想这个地区过去有很多企业,而这些企业可分为两类:







第一类




在经营中对营商环境感到满意,遂选择继续留在该地区经营







第二类




在经营中对营商环境感到很不满意,遂选择从该地区退出

显然,统计样本完全由参与调研的属地企业构成,就包括了第一类企业而排除了第二类企业,而这同样会拉高对营商环境现状的总体评价。


一个例子

当然,笔者并不认为,上述案例中统计调查机构有意利用自选择偏差进行误导。按照美国耶鲁大学统计学教授加里·史密斯的观点,自选择偏差几乎隐藏在所有关于满意度的统计调查中。在《简单统计学:如何轻松识破一本正经的胡说八道》这本畅销书里,史密斯教授列举了如下一个例子,令人印象深刻。

一家航空公司曾打出广告:在经常从纽约飞往芝加哥的商业旅行者中,84%的人更青睐这家航空公司,而不是其他竞争对手。

但蹊跷的是,统计数据却表明,在经常从纽约飞往芝加哥的商业旅行者中,只有8%的人选择了这家航空公司。如果84%的人更青睐这家航空公司,那么为何真正选择此家公司的人只有8%呢?

谜底最后揭晓——原来,84%这一统计结果所依据的调查样本,完全由这家公司从纽约飞往芝加哥的一架航班上的乘客构成。史密斯教授最后不无调侃地指出:“选择这家航空公司的旅行者更喜欢这家公司,这没有什么好奇怪的。真正奇怪的是,还有16%的旅客更喜欢另一家航空公司。”



简单统计学:如何轻松识破一本正经的胡说八道


加里·史密斯 著

刘清山 译

后浪出版公司2018年版



其他例子


值得指出的是,自选择偏差不仅仅困扰统计调查。事实上,只要利用观测数据而非实验数据进行统计分析,我们均可能陷入此偏差。在这里举一个医学上的例子。心脏搭桥术是指,当冠状动脉发生阻塞导致心脏供血不足时,外科医生将一条心血管移植到动脉阻塞处,以让血液能够绕过阻塞重新循环起来。医学界目前公认为,心脏搭桥术能够延长患者的寿命,是治疗冠心病的有效手段。但是,心脏搭桥术在过去一直受到很多质疑。

这些质疑当然并非无中生有,因为有基于过往病例的统计分析表明:平均来看,与没有实施心脏搭桥术的患者相比,那些实施了手术的患者并没有活得更长。若事情果真如此,则患者冒着手术失败风险、忍受身体痛苦并承担昂贵医疗费用去实施此手术,就得不偿失了。不少外科医生为此感到困惑,毕竟他们在实践中发现,心脏搭桥术疗效挺不错。

那么,问题到底出在哪里呢?有研究者对此展开深入研究,并很快找到了答案。出乎意料的是,答案其实很简单:选择实施手术的患者,其病情通常都很严重,而选择不实施手术的患者,其病情通常都比较轻。

具有不同特征的个体主动选择接受不同的处理,就是所谓的“样本自选择”。这使得不同的处理结果混杂了不同的选择者个体特征的影响。从更直观的“可比性”角度看,实施手术的患者与未实施手术的患者是缺乏可比性的,因为两类群体具有不同的特征——前者病情通常较重,而后者病情通常较轻。对缺乏可比性的两类群体进行简单比较,显然无法为手术疗效提供科学的证据。
具有启发性的是,在日常生活中,如果我们不善于批判性思考,就很容易忽视自选择偏差,对因果关系草率下结论。例如,笔者认识一位老人,其常年坚持用一种比较独特的方法健身:用裸露的双脚底搓滚一圆柱形樟木棍。老人精神矍铄、身体硬朗。街坊邻居由此深信,此健身方法有奇效。笔者有家人欲仿效之,但笔者却对此不以为然。其实,独特的健身方法并不一定是老人身体健康的原因,人们或许夸大了此健身方法的效果。从老人“常年坚持”这一行为选择来看,他很重视身体保养,生活十分克制。这位老人的健康秘诀,很可能正在于此,而不在于具体的健身方法。


最后

让我们回到营商环境这个主题。地区营商环境改善,意味着公共服务软硬件的全面优化。一般来说,硬件设施改善起来相对较容易。只要资金支持到位,其甚至可以“一夜换新颜”。然而,优化软环境却非一时之功。这是因为,理念转变、作风改进、制度健全,均需一个过程。既然营商环境改善无法一蹴而就,我们就应秉持一种久久为功的健康心态。急着在短期内晒出成绩不足取。假若还错误地利用统计数据对成绩进行量化,则反倒有损公信力,从而更不足取。


企研数据创始学术顾问 · 耀军



姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授,博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,企研数据创始学术顾问。曾获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。研究领域:金融发展理论与实证、应用计量经济学。

邮箱:yaoyaojun@163.com

代表论文:

[1]姚耀军,施丹燕.互联网金融区域差异化发展的逻辑与检验——路径依赖与政府干预视角[J].金融研究,2017(05):127-142.

[2]姚耀军.制度质量对外资银行进入的影响——基于腐败控制维度的研究[J].金融研究,2016(03):124-139.

[3]姚耀军,董钢锋.中小企业融资约束缓解:金融发展水平重要抑或金融结构重要?-来自中小企业板上市公司的经验证据[J].金融研究,2015(04):148-161.




点击阅读原文进入CCAD数据库



·END·


星标⭐我们不迷路!

想要文章及时到,文末“在看”少不了!



点击搜索你感兴趣的内容吧


往期推荐


统计计量 | 关于内生性问题中寻找工具变量思路手册

机器学习 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结

机器学习 | 最全综述列表!

推荐 | 陈强老师的《机器学习及Python应用》上市啦

机器学习 | 项目的备忘清单!

老姚专栏 | 均值回归的力量

机器学习 | 有趣有用的通俗讲解







数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 姚耀军
排版编辑 | 青酱

    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存